Fine-grained population maps are needed in several domains, like urban planning, environmental monitoring, public health, and humanitarian operations. Unfortunately, in many countries only aggregate census counts over large spatial units are collected, moreover, these are not always up-to-date. We present POMELO, a deep learning model that employs coarse census counts and open geodata to estimate fine-grained population maps with 100m ground sampling distance. Moreover, the model can also estimate population numbers when no census counts at all are available, by generalizing across countries. In a series of experiments for several countries in sub-Saharan Africa, the maps produced with POMELOare in good agreement with the most detailed available reference counts: disaggregation of coarse census counts reaches R2 values of 85-89%; unconstrained prediction in the absence of any counts reaches 48-69%.
translated by 谷歌翻译
视觉感知和语言理解是 - 人类智力的基本组成部分,使他们能够理解和理论对象及其相互作用。对于机器具有这种能力来推理这两种方式来发明新的机器人人类协作系统,这一点至关重要。深度学习的最新进展已建立了视觉场景和语言的单独复杂表示。但是,了解多模式推理的共享环境中两种方式之间的关联仍然是一个挑战。该论文着眼于语言和视觉方式,促进了如何利用和使用神经网络的视觉和语言任务的关键方面的理解来支持推理。我们从一系列作品中得出了这些理解,做出了两倍的贡献:(i)从动态视觉场景中响应语言查询的动态视觉场景的内容选择和构建时间关系的有效机制,并为推理过程准备足够的知识(ii) )新框架通过利用直接从数据或外部先验指导的视觉语言关联来实现神经网络进行推理。
translated by 谷歌翻译
我们提出了一个数据收集和注释管道,该数据从越南放射学报告中提取信息,以提供胸部X射线(CXR)图像的准确标签。这可以通过注释与其特有诊断类别的数据相匹配,这些数据可能因国家而异。为了评估所提出的标签技术的功效,我们构建了一个包含9,752项研究的CXR数据集,并使用该数据集的子集评估了我们的管道。以F1得分为至少0.9923,评估表明,我们的标签工具在所有类别中都精确而始终如一。构建数据集后,我们训练深度学习模型,以利用从大型公共CXR数据集传输的知识。我们采用各种损失功能来克服不平衡的多标签数据集的诅咒,并使用各种模型体系结构进行实验,以选择提供最佳性能的诅咒。我们的最佳模型(CHEXPERT-FRECTER EDIDENENET-B2)的F1得分为0.6989(95%CI 0.6740,0.7240),AUC为0.7912,敏感性为0.7064,特异性为0.8760,普遍诊断为0.8760。最后,我们证明了我们的粗分类(基于五个特定的异常位置)在基准CHEXPERT数据集上获得了可比的结果(十二个病理),以进行一般异常检测,同时在所有类别的平均表现方面提供更好的性能。
translated by 谷歌翻译
如今,越来越多的人被诊断出患有心血管疾病(CVD),这是全球死亡的主要原因。鉴定这些心脏问题的金标准是通过心电图(ECG)。标准的12铅ECG广泛用于临床实践和当前的大多数研究。但是,使用较少的铅可以使ECG更加普遍,因为它可以与便携式或可穿戴设备集成。本文介绍了两种新型技术,以提高当前深度学习系统的3铅ECG分类的性能,从而与使用标准12铅ECG训练的模型相提并论。具体而言,我们提出了一种以心跳回归数量的形式的多任务学习方案,以及将患者人口统计数据整合到系统中的有效机制。随着这两个进步,我们在两个大规模的ECG数据集(即Chapman和CPSC-2018)上以F1分数为0.9796和0.8140的分类性能,这些数据分别超过了当前最新的ECG分类方法,该方法超过了当前的ECG分类方法。甚至那些接受了12条铅数据的培训。为了鼓励进一步开发,我们的源代码可在https://github.com/lhkhiem28/lightx3ecg上公开获得。
translated by 谷歌翻译
本文报道的研究通过应用计算机视觉技术将普通的垃圾桶转化为更聪明的垃圾箱。在传感器和执行器设备的支持下,垃圾桶可以自动对垃圾进行分类。特别是,垃圾箱上的摄像头拍摄垃圾的照片,然后进行中央处理单元分析,并决定将垃圾桶放入哪个垃圾箱中。我们的垃圾箱系统的准确性达到90%。此外,我们的模型已连接到Internet,以更新垃圾箱状态以进行进一步管理。开发了用于管理垃圾箱的移动应用程序。
translated by 谷歌翻译
Web爬行的数据集已在最近的图像文本模型(例如剪辑(对比语言图像预训练)或火烈鸟)中启用了非凡的概括功能,但是对数据集创建过程知之甚少。在这项工作中,我们介绍了六个可公开可用数据源的测试床 - YFCC,LAION,概念标题,机智,redcaps,shutterstock-,以调查预训练分布如何在剪辑中诱导稳健性。我们发现,预训练数据的性能在分布变化之间有很大的变化,没有单个数据源主导。此外,我们系统地研究了这些数据源之间的相互作用,发现组合多个来源并不一定会产生更好的模型,而是稀释了最佳个体数据源的鲁棒性。我们将经验发现与简单环境中的理论见解相辅相成,其中结合训练数据还会导致稳健性稀释。此外,我们的理论模型为LAION数据集中最近采用的基于夹的数据过滤技术的成功提供了候选解释。总体而言,我们的结果表明,仅仅从Web中收集大量数据并不是建立预训练数据集以进行鲁棒性概括的最有效方法,因此需要进一步研究数据集设计。
translated by 谷歌翻译
COVID-19大流行已经暴露了全球医疗服务的脆弱性,增加了开发新颖的工具来提供快速且具有成本效益的筛查和诊断的需求。临床报告表明,Covid-19感染可能导致心脏损伤,心电图(ECG)可以作为Covid-19的诊断生物标志物。这项研究旨在利用ECG信号自动检测COVID-19。我们提出了一种从ECG纸记录中提取ECG信号的新方法,然后将其送入一维卷积神经网络(1D-CNN)中,以学习和诊断疾病。为了评估数字信号的质量,标记了基于纸张的ECG图像中的R峰。之后,将从每个图像计算的RR间隔与相应数字化信号的RR间隔进行比较。 COVID-19 ECG图像数据集上的实验表明,提出的数字化方法能够正确捕获原始信号,平均绝对误差为28.11 ms。我们提出的1D-CNN模型在数字化的心电图信号上进行了训练,允许准确识别患有COVID-19和其他受试者的个体,分类精度为98.42%,95.63%和98.50%,用于分类COVID-19 vs.正常,与正常人分类, COVID-19与异常心跳和Covid-19和其他类别分别与其他阶级。此外,提出的方法还为多分类任务实现了高级的性能。我们的发现表明,经过数字化的心电图信号训练的深度学习系统可以作为诊断Covid-19的潜在工具。
translated by 谷歌翻译
睡眠呼吸暂停(SA)是一种睡眠障碍,其特征是打s和慢性睡眠,这可能导致严重的疾病,例如高血压,心力衰竭和心肌病(心脏肌肉组织的增大)。心电图(ECG)在识别SA中起着至关重要的作用,因为它可能显示出异常的心脏活性。对基于ECG的SA检测的最新研究集中在功能工程技术上,这些技术从多铅ECG信号中提取特定特征,并将其用作分类模型输入。在这项研究中,提出了一种基于S峰检测的新型特征提取方法,以增强使用单铅ECG对相邻SA段的检测。特别是,使用单个铅(V2)收集的ECG特征用于识别SA发作。在提取的功能上,对CNN模型进行了训练以检测SA。实验结果表明,所提出的方法从单铅ECG数据中检测到SA比现有的最新方法更准确,具有91.13%的分类精度,敏感性为92.58%和88.75%的特异性。此外,与S峰相关的特征的进一步使用可以提高分类准确性0.85%。我们的发现表明,提出的机器学习系统有可能成为检测SA发作的有效方法。
translated by 谷歌翻译
表示技术的快速发展和大规模医学成像数据的可用性必须在3D医学图像分析中快速增加机器学习的使用。特别是,深度卷积神经网络(D-CNN)是关键参与者,并被医学成像界采用,以协助临床医生和医学专家进行疾病诊断。然而,培训深层神经网络,例如在高分辨率3D体积的计算机断层扫描(CT)扫描中进行诊断任务的D-CNN带来了强大的计算挑战。这提出了开发基于深度学习的方法,这些方法在2D图像中具有强大的学习表示形式,而是3D扫描。在本文中,我们提出了一种新的策略,以根据沿轴的相邻切片的描述来训练CT扫描上的\ emph {slice level}分类器。特别是,每一个都是通过卷积神经网络(CNN)提取的。该方法适用于具有每片标签的CT数据集,例如RSNA颅内出血(ICH)数据集,该数据集旨在预测ICH的存在并将其分类为5个不同的子类型。我们在RSNA ICH挑战的最佳4 \%最佳解决方案中获得了单个模型,其中允许模型集成。实验还表明,所提出的方法显着优于CQ500上的基线模型。所提出的方法是一般的,可以应用于其他3D医学诊断任务,例如MRI成像。为了鼓励该领域的新进步,我们将在接受论文后制定我们的代码和预培训模型。
translated by 谷歌翻译
跨不同边缘设备(客户)局部数据的分布不均匀,导致模型训练缓慢,并降低了联合学习的准确性。幼稚的联合学习(FL)策略和大多数替代解决方案试图通过加权跨客户的深度学习模型来实现更多公平。这项工作介绍了在现实世界数据集中遇到的一种新颖的非IID类型,即集群键,其中客户组具有具有相似分布的本地数据,从而导致全局模型收敛到过度拟合的解决方案。为了处理非IID数据,尤其是群集串数据的数据,我们提出了FedDrl,这是一种新型的FL模型,它采用了深厚的强化学习来适应每个客户的影响因素(将用作聚合过程中的权重)。在一组联合数据集上进行了广泛的实验证实,拟议的FEDDR可以根据CIFAR-100数据集的平均平均为FedAvg和FedProx方法提高了有利的改进,例如,高达4.05%和2.17%。
translated by 谷歌翻译